Mô-đun giới thiệu này nối liền khoảng cách giữa các mảng ký tự thô, chưa được cấu trúc và tính chính xác toán học của lý thuyết ngôn ngữ hình thức. Chúng ta chuyển từ tìm kiếm mệnh lệnh—kiểm tra từng ký tự thủ công—đến mô tả khai báo, nơi chúng ta định nghĩa một ngữ pháp hình thức biểu diễn tập vô hạn các chuỗi hợp lệ.
1. Bản chất của entropy chuỗi
Dữ liệu thô vốn dĩ "lộn xộn" vì thiếu cấu trúc; nó chỉ đơn thuần là một chuỗi byte cho đến khi một ngữ pháp hình thức phân loại các thành phần của nó. Trong thiết kế giao thức, việc xác minh entropy này là rào cản đầu tiên chống lại dữ liệu đầu vào bị lỗi.
2. Mô hình & Máy tự động
Biểu thức chính quy (Regex) bắt nguồn từ Thứ bậc Chomsky. Biểu thức chính quy đóng vai trò như bản vẽ kỹ thuật để xây dựng Máy tự động hữu hạn xác định (DFA). Thay vì viết if-else chuỗi để tìm mẫu, chúng ta định nghĩa điều gì đó về mẫu là, cho phép động cơ xử lý logic duyệt qua.